[Lecture Notes] 2017年ACM图灵大会

Posted by Aerber Zhou on 2017-09-01

#一

TURC.segai

深度学习在自然语言处理中的应用(陈恩红)

深度学习在自然语言处理应用的程度

语言模型,

字符级别,

分词.词性标注.命名实体识别-基于深度学习的序列标注算法,

文档分类-多层次文档分类,

encoder-decoder框架,

对话系统,

机器翻译-基于attention机制,

阅读理解,

图片标注生成

诗歌自动生成

基于规划的诗歌生成(主题规划(统计/知识))

诗歌生成模型-基于attention的句子生成模型

基于主题规划衍生出的多种产品形式

语音作诗,藏名诗,藏头诗。。。

基于语义的

弹幕

框架-视频时序标注框架(

语义表征(T-DSSM.损失函数基于对比学习),

视频高潮片段标注(整体主题分布,提取特征分布,))

词汇蕴含识别

是文本蕴含识别的重要组成部分

挑战:词义,蕴含关系的多样性

CENN(Centent-Enriched Neural Network)

试题难度预测

标准化测试(规则,公平性保障)

在线学习系统构造题库,试题标注

帮助教师改卷

英语阅读理解-挑战

TACNN模型框架(统一文本表示,量化文本对于不同问题的重要性,消除考试带来的难度不可比性)

NLP

#二

TURC.segai

Beyond Deep Supervised Learning for Visual Recognition(Liang Lin)

Deep Learning:the Engine of AI

Neural networks 神经网络

DNNS as A universal joint Learning framework/Engine

eg. cross-domain visual matching

network architecture:not a black box

应用:交通实时分析系统,人群分析系统

weakly-Supervised semantic Inpainting

recursive neural nets for scene parsing

task-oriented action prediction

knowledge-guided recurrent prediction

progressive and cost-efficient Learning(active self-paced Learning,communication)

unsupervised Representation Learning无监督的表达学习

#三

TURC.segai

Revolution Driving with Deep Learning(ن؛ژه‡¯ï¼ŒCEO,Horizon Robotics)

Horizon Robotic:è‡ھهٹ¨é©¾é©¶(و•ˆçژ‡ï¼Œن¾؟وچ·و€§ï¼Œه®‰ه…¨)

Deep Learning:

Non-cinvex& non-linear

intensive computation

Sensitive to initialization

over-fitting

vanishing gradient

big data

GPU

generalization error=A(Approximation)+E+O

hand-craft feature

deep neural networks

deep reinforcement Learning:alphago

و‍„ه»؛“ه¦ن¹ ç³»ç»ں",而ن¸چوک¯"被è®练系ç»ں”(Learning from natural user behaviors and simulations)

The full-stack approach to"brain of car"

Algorithmic designing principles(transparency,large-scale training…)

Bayes networkè´‌هڈ¶و–¯ç½‘络

FPGA

#四

TURC

5.14

Alibaba(Jingren Zhou)

ACM(Vicki L. Hanson)

menber-driven,volunteer-led

ACM数字图书馆-recent and upcoming

practitioners

future of computing academy

ACM Awards:SIG awards,career-long contributions,Early-to-Mid-career contributions,student contribution,specific type of contributions

Diversity and Inclusion:women,disabled

http://www.notabletechnicalwomen.org/

Digital Vellum(牛皮纸):Defense Against the Dark Ages(Vinton Cerf)

Archiving Static Text/Image Content

Movies Digital Storage Dilemma(LTO Linear Tape Open)

Wha about executable content?

Interpreting Date(File)

22nd Century Doris Kearns Goodwin

1000 years?(old File format,encoding schemes,databases)

Challenges(interpretation of bits;

metadata capture;

source or executable code;

Digital X-ray;

capacity for BIG DATA;

bankruptcies,sunset of apps,OS,hardware;

intellectual property rights;

legal frameworks,exceptions for preservation)

Access Control

What happens when we die?

The OLIVE Project(Client Structure,

VM Image Representation,

Static snapshot of the web

www.archive.org)

The RHIZOME Project(

preservation of Digital artworks,

WebRecorder System)

Example Other Project(

the computer history museum,

google book scans and cultural institute

CNRI Digital object architecture and identifiers,

IPFSInterplanetary File System,

international internet preservation consortium,…)

Evolution of the artificial visual system(Wen Gao)

the city brain for Hangzhou(to slove traffic problem)

the platform of city brain

video processing system in cloud

video sensing in city brain

signal timing optimization

issue:

off-line training(目前无法实现on-line training),数据面向存储,

BigMM Data Chanllenges in Smart City(Storage,retrieval模式识别,identify),

Artificial visual system Challenge("city eye"摄像头功能简单)

1C1S-one camera one stream 摄像头单流

weakness: long delay,low accuracy(QP=38下界,意味着Bitrate=2.4M),feasible.

QP-Quantization parameter

for face detection

MCMS-多摄像头多流

SCDS-具有编码和特征提取功能的摄像头(问题:rate-distortion optimization(

1.图像编码优化-剔除编码冗余(时间上,空间上,本身的)-使用基于模型的编码);

2.视频特征提取的优化(SIFT Feature,CDVS(推荐),CNN(深度学习));

3.联合R-D 与 R-A优化)

Syntax

“数字视网膜”-前端摄像头

Game Theory in Economic and FinTech(金融科技)(Andrew Chi-Chih Yao)

IIIS-Institute for Interdisciplinary Information Sciences

diamond-based quantum computer

FinTech:

way(makingtradional services.moreefficient,novel new services)

why(

new golden age of computer Science(quantum computer,Economics,Google:alphabet holding Co. ,harbinger:possible role reversals))

new scientific drivers of FinTech(

AI/Big Data,

Theory of building reliable distributed systems,

Theory of cryptography,

Game Theory(math models of conflict and cooperatation,k-items))

#五

‌TURC

‌人工智能时代的科学家创业

3.12

李开复博士

‌创新工厂投资案例

Face++ 支付宝 马云

智融集团 用钱宝 利用AI技术解决风控问题(贷款。投资)

美图

医疗 IBM Waston

政治 川普选举 精准信息投放

‌缺陷:

需海量数据。

单一领域。

缺超级科学家。

无自我意识。

无审美。。。

‌关于科学家创业

方式:自己创业,技术授权,技术开源,找商业合伙人合作

学校。专注科研。

对于社会:报酬。声誉。资源。时间。

对于大学:参考 斯坦福大学

AFTER:(问答)

‌No 人脸识别

做识别:巨大数据量。选未做过识别的领域。

‌Don not care 个人数据(隐私问题)

在AI时代,数据优者胜。

‌工项链(区块链)开放。

AI极客联合在一起,开源。无收费。

让facebook等投降与开源。

‌AI会使人失枯燥的职业,但可以使人追求更高的价值。

‌声音分类识别(对婴儿,老人。。)领域,商业价值一般但是值得做。结合情感识别。

‌AI于信息安全的结合。

AI医疗:多个医院数据结合起来进行数据训练,获得癌症相关的有效研究数据。

‌人情感的识别

从表象层面理解和模仿人的情感是可以做到的,但是并不意味着AI存在情感。

#六

‌TURC

5.13

‌开幕

李云浩(ACM General Co-Chair)

Alexander Wolf(ACM General Co-Chair)

Vichi L. Hanson(ACM president)

Wen Gao(Vice President of NSFC)

Zhimin Li(ACM China Honorary Advisory Council Co-Chair)

Vinton Cerf(ACM Award Chair)

Robet B. Schnabel(ACM CFO)

Kai-Fu Lee(Sinovation Ventures)

Chuanping Hu(TURC General Co-Chair)

John Lui(TURC PC Co-Chair)

‌CS 的卓越ideas

Speaker:Robert Schnabel

机械学习

分散点(穷举法暴力解决)

未分散点(投影至多维空间求解)

app:更改人的年龄,更改绘画的艺术风格

gate

overfitting

clustering

hidden structure

应用:交通。决定背景。

‌In “What” We Trust?

In BlockChain We Trust!

倪明选 澳门大学

Lionel?

gold?

computer?

network?

data:修改,移动,权限

BlockChain 1991

BlockChain 1.0:BitCoin 比特币  /1553.50刀

Cryptography 密码学

Byzantine 拜占庭的

BlockChain 2.0:Smart Contracts

Hyperledger 用于记账

BlockChain Taxonomy 分类法:公共,私有

ISSUE:平均响应时间为10min,每秒传输成功数(7)低,poor Capacity,Wasted Resource,

BitCoin Mining(挖"矿")

Private BlockChain 论文

‌圆桌论坛 (Panel): Big Data or Brain Powered Artificial Intelligence: Turing or Quantum?

Turing Test:机器能思考?

1.李开复

深度学习≠生物脑神经

生物被自然选择,AI被人类选择(梯度下降)

量子计算:更更更快的算力

进化:生物智能的训练过程

遗传:生物界的迁移学习

AI可用于:深度学习,迁移学习,强化学习,统计学习,决策森林,数据降维,蒙地卡罗搜索,实遗憾最小化

AI将平台化

2.姚期智

title:使量子计算机变快的原因

Crystallography 晶体学:

X-Ray Crystallography

Macro-Biological Molecules

应用

3.Alex Wolf

4.Vinton Cerf

5.高文

6.李向阳

#七

‌TURC.segbio

‌基因组,大数据与精准医学(陈润生)

‌精准医学的核心

组学大数据和图学的结合

组学数据获取与组学数据挖掘

‌精准医学能使医学发生什么变化?

从诊断治疗到健康保障

个体化治疗,对全民全程的健康保障功能

产业化前景

生物样本和数据

基因测序(转录组)

分子诊断

基于精准医学理念的个性化治疗

‌实现精准医学要有哪些基础?

组学,大数据:海量数据的获得与挖掘

基因型与表型的关联

‌精准医学才刚刚上路

基因组,转录组中的挑战:基因组中的暗信息

遗传密码中的编码序列(3%),DNA-转译RNA-蛋白质。

海量数据的处理与挖掘:计算量大;数据增速快,数据信噪比低,样本缺失高;样本量小;有效事件频率低(组织,时期,状态不同)

疾病相关的复杂网络:动态的,有向的,双色的,非线性的

高度异质化

数据共享

‌创新机遇

基因组研究:非编码序列的运用(生物越高等,其非编码序列占比越多)

转录组研究:非编码序列每时每刻在工作(有功能)

非编码RNA的功能研究:PCGEMI(导致前列腺癌),MALAT-1(导致飞小细胞肺癌),肿瘤干细胞IncTCF7,调控淋巴机制研究,H19(转录本,肿瘤抑制基因)

#八

‌TURC.segboi

‌Big Data Analysis and Mining in Microbiome(微生物)

‌背景

微生物与人类疾病:破腹产,“观音土”,粪便制药

微生物与环境

什么是微生物

人类肠道(微生物)

微生物组学

数据收集与分析

数据分析与挖掘

炎性肠病

‌挑战

微生物数据分析:高维数据分析,不同数据分别,数据的复杂关联。。。

‌目标

数据挖掘与整合-NMF(非负矩阵的分解)

微生物数据可视化(t-SNE,拉普拉斯正规化)

‌项目与结果

海洋生物数据:海洋环境对海洋微生物的影响大于距离

人类微生物数据:肠道微生物(3种)

。。。

#九

‌TURC.segbio

‌Integrative Analysis of High-throughput TF Binding Data(黄德双)

‌介绍

外显子用于翻译

‌转录因子的绑定的矫正

基于张量的分析

Non-convex 非凸方式

Proposed 推荐方式0

实验

AUC

ChIP-sequence and PWM(位置加权矩阵)

DML Mothed

DiscMLA

‌FETS

数字编码,联合降维,AUC(矩阵)

‌结论

#十

‌TURC.segbio

‌生物网络与药物靶点的识别(中南大学)

‌网络(假定为线性系统)

网络与动态模型(控制链)

‌可控性(调节关系)

网络是可以可控的

判断test:

方法一:rank©=rank[A,AB,…,A^n-1 B]=n,n为节点数

方法二:结构可控,Max{rank[A,AB,…,A^n-1 B]=n},

结构可控一般系统可控

可接近性

Dilation(节点集个数大于临域个数)

‌steering node:无不可达的顶点(找source SCCs),无dilation(MDS)

MSS=MDS ∪ PDS

找图MSS的最大流的最小花费

‌药物靶点

Drug Target-Steering nodes

Drugs-Control Signal

CAC Network

#十一

‌TURC.segbio

‌Genome Informatics and Its Application in Precision Medicine (基因组信息学在精准医疗中的应用)(叶凯,西安交大)

‌精准医疗

精准诊断,精准治疗

‌基于模型的检测(变异预测)

CNV:gain,loss

read-pair

Tandem duplications

#十二

TURC.segbio

‌Clinical Data Repository in Precision Medicine: Technical Solution and Practice,李厦茂(GeneDock,CEO)

基因检测

智能辅助诊断应用